SpatialAct: Probando el razonamiento-acción espacial de VLMs
Los VLMs son buenos en razonamiento espacial pero fallan en interacciones multiturno. SpatialAct revela la brecha entre percepción y acción en 3D.
Los VLMs son buenos en razonamiento espacial pero fallan en interacciones multiturno. SpatialAct revela la brecha entre percepción y acción en 3D.